разбор

Это были самые нечестные выборы в истории России Из-за масштабов фальсификаций нельзя даже прикинуть количество украденных голосов. Но мы нарисовали «хвост кометы» — по нему все понятно без слов

Источник: Meduza

Мы говорим как есть не только про политику. Скачайте приложение.

ЦИК России 18 марта объявил результат голосования на «выборах» президента: по предварительным данным комиссии, Владимир Путин, баллотировавшийся как самовыдвиженец, получил 87,28% голосов при явке 77,44%. Оба значения — рекордные в истории современной России. Поскольку ЦИК, как ни странно, продолжает публиковать данные по отдельным избирательным участкам (а электоральные аналитики продолжают их скачивать и систематизировать), это позволяет оценить, как именно были достигнуты эти рекордные результаты. Если вынести за скобки условия проведения «выборов», а говорить только о подсчете голосов, то короткий ответ такой: с помощью фальсификаций невиданного прежде масштаба.

На этот раз вся аналитика по результатам голосования, как в этом тексте, так и в других изданиях, основана на данных, собранных с сайта ЦИК и выложенных в открытый доступ программистом и электоральным аналитиком Иваном Шукшиным — в них присутствуют 98% УИК, в том числе с аннексированным Крымом, но без материковой Украины. С собственным анализом результатов выборов Ивана Шукшина можно ознакомиться здесь.

А эта аналитика — четкое доказательство того, что фальсификации были?

Некоторые из статистических аномалий, которые видны в данных с УИК, совершенно очевидно являются свидетельством фальсификаций, так как не могут быть объяснены чем-то иным. Другие просто выглядят очень подозрительно, но, в принципе, могут быть результатом иных причин. Другими словами, аномалии бывают разными и их следует рассматривать отдельно.

Две главные аномалии, которые характерны для почти всех выборов в России в последние десятилетия, — это корреляция результатов лидера голосования с явкой и пики на круглых значениях явки и результата. И на этот раз масштаб обеих аномалий достиг рекордных значений.

Прежде чем переходить к графикам и их интерпретации, нужно сразу прояснить, что может, а чего не может электоральная аналитика после выборов. Главная сильная сторона статистического подхода — возможность оценить масштаб аномалий, которые наблюдались в процессе голосования в целом, сравнить результаты голосования на выборах в разные годы и в разных странах. Слабая сторона в том, что сама по себе статистика не способна поймать за руку фальсификаторов: переход от «аномалий» к «фальсификациям» всегда опирается на какие-то предпосылки, которые нужно иметь в виду при интерпретации.

Некоторые из статистических аномалий совершенно очевидно являются свидетельством фальсификаций, так как не могут быть объяснены чем-то иным (например, пики явки или результата на круглых значениях). Другие просто выглядят очень подозрительно, но, в принципе, могут быть результатом иных причин. Другими словами, «свидетельская сила» у разных аномалий разная, поэтому в одних случаях интерпретировать их как фальсификации совершенно справедливо, а в других делать это нужно осторожно. «Золотым стандартом» при этом является сочетание статистического анализа и эксперимента: например, распределение наблюдателей на случайно отобранные участки и анализ результатов голосования на участках, где они присутствовали — и на остальных УИК. В любом случае при интерпретации результатов сильно помогает исторический контекст, то есть результаты предыдущих выборов.

Аномалия-1. Корреляция явки и результата лидера. Вбросы и метод Кислинга — Шпилькина

Физик и электоральный аналитик Сергей Шпилькин с начала 2010-х годов изучает распределение голосов и явки на российских выборах. Он предложил метод, позволяющий отделить нормальные голоса от вбросов. Логика этого подхода устроена так: точное число избирателей, пришедших на участки, и количество голосов, отданных ими за разных кандидатов, зависит от множества случайных факторов. Поэтому можно ожидать, что в целом распределение разных УИК по явке и результату кандидата будет характерным для случайных процессов, то есть нормальным, гауссовым, колоколообразным. Поэтому на двумерной диаграмме распределения УИК по явке и результату кандидата избирательные участки должны выглядеть как одно симметричное пятно. Если же в распределении явки и голосов появляются отклонения от такого распределения — а во время российских выборов они наблюдаются как минимум с 2004 года, — такие результаты называются аномальными и требуют отдельного объяснения.

Самое очевидное объяснение — это физические вбросы бюллетеней за кандидата от власти в ящики для голосования или приписки определенного числа бюллетеней в протоколы. Такие фальсификации одновременно повышают явку и итоговый процент голосов за кандидата от власти. УИК, где происходят такие вбросы, формируют рост правого плеча в нормальном распределении, а на двумерной диаграмме (где отложены явка и процент кандидата от власти) выглядят как хвост кометы, уходящий в правый верхний угол.

Вот как выглядело такое двумерное распределение УИК по явке и результату Владимира Путина на прошлых президентских выборах 2018 года.

Image

Видно, что хвост аномальных голосов уже вносит очень большой вклад в общий результат, — даже если судить просто по количеству УИК, где наблюдаются аномальные результаты.

А вот как выглядит то же самое распределение уже на нынешних «выборах»:

Image

Ядро нормальных УИК на нынешних «выборах» просто исчезло, остались практически только аномальные участки. На явке около 40% можно видеть слабое симметричное пятно, напоминающее нормальное ядро прошлых выборов. Если посмотреть на региональную разбивку, то можно заметить, что почти все это ядро составляют УИК Москвы. Однако даже на московских участках при выглядящей симметрично явке можно заметить, что распределение результатов за Владимира Путина имеет два кластера с центрами приблизительно на 65 и 85 процентах. Это можно было бы объяснить тем, что внутри столицы существуют «две Москвы» с принципиально разной поддержкой этого кандидата. Ни на одних предыдущих выборах такой картины в Москве не наблюдалось. Возможным объяснением такой картины может быть влияние массового дистанционного электронного голосования (ДЭГ) на отдельных УИК, повышающее процент кандидата от власти. Такую же картину может давать и переписывание голосов от одного кандидата другому без вбросов и соответствующего изменения общей явки.

Image

В Санкт-Петербурге при этом картина принципиально иная — здесь вовсе нет кластера участков со средней явкой, а наблюдается практически «чистый» хвост кометы (а также «ступеньки» отдельных УИК, где результаты явно были просто нарисованы). Аналогичная — но еще более выраженная — картина видна в аннексированных Крыму и Севастополе.

Аномальную картину распределения голосов, потерявшую всякую связь с гауссианой, можно было бы попытаться объяснить неоднородностью российских регионов. Общероссийское распределение УИК складывается из разных регионов, где и явка, и поддержка действующей власти может сильно отличаться в силу местных особенностей и традиций. В таком случае можно было бы ожидать, что распределение голосов не будет гауссовым даже без каких-либо фальсификаций.

Это возражение могло бы быть сильным, если бы не одно но: выборы в России происходят не первый год, но только сейчас, в 2024 году, нормальное распределение голосов в целом по стране было полностью стерто. На графике ниже приведены распределения голосов по всем президентским выборам начиная с 2000 года. На нем видно: то, что раньше было отклонением, стало нормой, а норма полностью исчезла.

Image

Аномалия-2. Пики на круглых значениях

Второй важнейшей аномалией этих и предыдущих выборов является возникновение пиков на круглых значениях явки и результата — так называемой «пилы Чурова». В отличие от корреляции результата и явки, о причинах которой можно спорить, это аномалия, которую нельзя объяснить ничем, кроме подгонки протоколов под нужный результат. Важно отметить, что существует некоторый небольшой фоновый уровень, из-за которого пики на распределениях могут возникать по чисто арифметическим причинам — например, из-за конечного числа зарегистрированных избирателей на УИК. Однако этот базовый фон как раз можно хорошо предсказать с помощью чисто статистических методов, что было сделано, в частности, Дмитрием Кобаком, Сергеем Шпилькиным и Максимом Пшеничниковым в серии статей в Significance и других научных журналах (очень подробно об этом можно прочитать здесь).

Исследователи статистически проверили то, что, в общем-то, видно и невооруженным взглядом по диаграммам и графикам: пики на круглых значениях впервые появляются в России (то есть превышают ожидаемый фон) на выборах 2004 года — и с тех пор становятся все более выраженными.

Чтобы количественно оценить, насколько ухудшилась ситуация с такими фальсификациями при подсчете голосов на нынешних «выборах», мы воспроизвели анализ Кобака, Шпилькина и Пшеничникова уже с новыми данными, собранными Иваном Шукшиным. На графике ниже приведено распределение избирательных участков по явке и результату на нынешних и предыдущих президентских выборах.

Image

Видно, что, судя по пикам на «красивых» значениях, ситуация с рисовкой протоколов не просто ухудшилась, а принципиально изменилась: больше нет доминирующего большинства участков с нормальной явкой, к которым добавляются участки с фальсификациями. Теперь последние составляют большинство — а вычленить из распределения какую-то нормальную среднюю явку вовсе невозможно: виден небольшой горб на значении 35–40% (как сказано выше, это в большинстве своем московские УИК) и более крупный на 60–65%. То есть распределение полностью потеряло нормальность.

Сравнивая президентские выборы 2018 и 2024 годов, важно помнить, что уровень фальсификаций в 2018-м уже был настолько масштабен, что их результаты должны быть отменены даже по российским законам. Согласно Федеральному закону «О выборах Президента» (а именно подп. 2 п. 5 ст. 76), если есть основания признать недействительными итоги голосования на участках, где зарегистрировано больше 25% всех избирателей, то по закону результаты выборов в стране нужно аннулировать. Наблюдатели, которые изучили записи с 1748 избирательных участков из 20 регионов, обнаружили на 933 (55%) из них значительные фальсификации. Статистический же анализ тех выборов говорит о том, что аномальные по явке и результату участки уже тогда захватывали более 30% избирателей, что больше указанного в законе критического порога. На этот раз их стало в разы больше — однако, чтобы дать более точную оценку, понадобится время.

Нынешнюю ситуацию полезно сравнить и с выборами 2000 года. Теми самыми, на которых был впервые избран Владимир Путин и которые стали последними президентскими выборами в России без пиков рисованных протоколов. Здесь четко видно, что аргументы о том, что Россия слишком особенная страна, к которой неприменимо нормальное распределение явки, не выдерживают никакой критики: хотя исходное распределение действительно имеет особенности, страна на двух графиках не изменилась — изменились принципы подсчета голосов.

Image

В своей статье в Significance, посвященной выборам 2018 года, Кобак, Шпилькин и Пшеничников приводят график того, как со временем в России росло число УИК с «красивыми» значениями явки и результата, свидетельствующими о переписывании протоколов. Мы воспроизвели этот расчет, добавив новые данные. Оказалось, что даже по сравнению с «грязными» выборами 2018 года количество участков с переписанными протоколами выросло почти вдвое: с 1708 до 2898 УИК, то есть речь идет о многих миллионах переписанных голосов.

Тут был медиа-файл, который доступен в полной версии материала. Посмотреть ее можно по этой ссылке.

Аномалия-3. Нарисованная явка и «скоростное» голосование

Еще одной, хотя и менее важной, но наглядной электоральной аномалией, стала рисованная динамика явки в ходе многодневного голосования. На нее обратил внимание, в частности, бывший сопредседатель «Голоса» и наблюдатель на выборах Роман Удот.

Суть аномалии сводится к тому, что, если отсортировать участки по регионам, ТИК и номерам УИК и отложить явку на каждый опубликованный час, будет заметно, что явка на некоторых УИК не просто идентична, но и согласованно меняется со временем. Другими словами, некоторые территориальные или региональные комиссии явку просто «рисуют». Теоретически такая отчетность может и не влиять на итоговый результат голосования, однако есть основания не доверять работе таких комиссий — сопоставление рисованной промежуточной явки с результатами на соответствующих УИК требует отдельного исследования.

Image

Так сколько голосов было украдено и каковы настоящие результаты?

Иван Шукшин в своем анализе приходит к выводу о том, что избирательные комиссии «вбросили» Владимиру Путину порядка 22 миллиона голосов, при этом основным инструментом фальсификаций стали не физические вбросы бюллетеней или «карусели», а прямое переписывание протоколов. Такой вывод сделан аналитиком на основании подхода Сергея Шпилькина. Вкратце он заключается в том, что нужно выделить основной кластер УИК с нормальной явкой, взять проценты за кандидатов из этого ядра и рассчитать для остальных УИК очищенное число голосов за лидера на основании количества голосов за других кандидатов, умноженное на коэффициент (взятый из «нормальных» УИК). Именно таким образом Шукшин насчитал 22 миллиона вбросов.

Авторы «Новой газеты Европа» с помощью тех же данных дали в полтора раза большую оценку — уже не 22, а 31,6 миллиона голосов. Такое большое различие объясняется тем, что «нормальными» Шукшин и «Новая газета Европа» считали разные кластеры голосов: в первом случае это было пятно с 50% избирателей в районе 85%-й явки, во втором случае — «московский» пик с явкой 40%.

Для сравнения: в 2018 году сам Сергей Шпилькин насчитал 6,5 миллиона добавленных голосов за Путина и еще 1,05 миллиона голосов, переброшенных от других кандидатов. Суммарно это соответствует 8,6 миллиона дополнительных голосов за Путина из тех 56,4 миллиона, что официально опубликовала ЦИК.

В реальности обе оценки кажутся неадекватными новой ситуации: как можно видеть на самых первых графиках выше, в России больше нет кластера нормальных УИК, по которым можно было бы рассчитать истинный процент голосов, поданных за кандидатов, и, соответственно, получить очищенные результаты. Метод Кислинга — Шпилькина имеет свои ограничения: во-первых, он учитывает только прямые вбросы, а потому не включает другие типы фальсификаций. Во-вторых, он работает тогда, когда аномальный подсчет голосов происходит все-таки не на большинстве участков. Сейчас, при наблюдающемся уровне достоверно документированных фальсификаций, никакого нормального большинства уже нет — методу просто не на что больше опереться.

В дальнейшем своем анализе Шукшин пытается выделить 11 регионов, где уровень фальсификаций минимален, и взять их в качестве образца. Это Владимирская область, Костромская область, Мурманская область, Республика Карелия, Республика Коми, Сахалинская область, Свердловская область, Томская область, Хабаровский край, Ярославская область, город Санкт-Петербург. При таком подходе оказывается, что Даванков должен был получить около 11% голосов россиян, а Путин — около 80%. Но у такого подхода собственные недостатки — неизвестно, как настроения избирателей в 11 отдельных регионах отражают общий уровень поддержки кандидатов. Поэтому называть эти результаты настоящими, то есть теми, которые были бы опубликованы, не будь фальсификаций, тоже некорректно.

И что в итоге?

Можно достоверно утверждать, что нынешнее голосование было самым искаженным фальсификациями в истории России — хотя точное число украденных голосов остается неизвестным. В любом случае мы знаем, что масштаб фальсификаций значительно превышает фальсификации 2018 года, а тогда на более чем трети участков в стране результаты должны были быть отменены.

Отдел «Разбор»

  • (1) Почему случайный процесс ведет к гауссиане?

    Когда на исход события влияет множество разнонаправленных факторов, то результат стремится к нормальному распределению. Как это происходит, ярко иллюстрирует доска Гальтона — на ее примере возникновение нормального распределения можно просто увидеть глазами.

  • (2) Гауссиана

    Функция Гаусса — это функция, введенная Иоганном Гауссом в 1809 году и описывающая плотность нормального распределения. К такому распределению стремится результат событий, на которые влияют множество случайных причин. Например, песок, падающий через сеть равномерно расположенных препятствий, на которых песчинки отклоняются в ту или иную сторону, будет в точке падения распределяться по гауссиане.

  • (3) «Пила Чурова»

    За аномальными пиками на круглых значениях такое название среди наблюдателей и электоральных статистиков закрепилось с 2011 года, когда председателем ЦИК был Владимир Чуров.

  • (4) Можно ли использовать Санкт-Петербург?

    При необходимости хоть как-то подсчитать число сфальсифицированных голосов приходится использовать наиболее «чистые» из имеющихся регионов. Шукшин исключил Москву из списка 12 таких «лучших из худших», но оставил в нем Санкт-Петербург. Судя по распределению голосов в городе, нам кажется такое решение спорным — однако нельзя не признать, что найти хоть какие-то «чистые» регионы в нынешних условиях практически невозможно.