Мы говорим как есть не только про политику. Скачайте приложение.
1.
Что случилось?
2.
Кто такой Сергей Шпилькин?
3.
О каких аномалиях идет речь?
4.
Как читать этот график?
5.
Что не так с этим графиком?
6.
Так, и в чем подвох?
7.
И что с того, что кривая не похожа на колокол?
8.
Что означают аномалии с данными явки?
9.
И кому нужны все эти аномалии?
10.
Допустим, все так и есть. Что теперь будет? Перевыборы?
Что случилось?
В социальных сетях и СМИ появилось много ссылок на посты Сергея Шпилькина о возможных манипуляциях на прошедших выборах в Госдуму. Шпилькин указывает на аномалии, выявленные с помощью статистического анализа данных ЦИК.
Кто такой Сергей Шпилькин?
Сергей Шпилькин — физик, который с 2007 года занимается анализом электоральной статистики. Он не первый и не единственный ученый, работающий в этой области. Об исследованиях Шпилькина много говорили после думских выборов 2011 года как о важном подтверждении, что эти выборы были нечестными. В 2012-м Шпилькин стал лауреатом премии «ПолитПросвет».
О каких аномалиях идет речь?
О самых разных. Выборы в Думу — масштабное явление, которое порождает большой массив данных. Эти данные находятся в открытом доступе.
Показательна ситуация с данными о явке на выборы. Данные о явке (о доле проголосовавших избирателей от числа зарегистрированных избирателей) есть для каждой участковой комиссии.
Очевидно, что на некоторых участках явка выше, а на некоторых — ниже. Есть определенное количество участков с явкой в 100% — например, те, что расположены в больницах или военных частях. Очевидно, таких участков не может быть слишком много.
Теперь посмотрите на этот график:
Это данные о вчерашних выборах в Москве. Вертикальная ось — число голосов, горизонтальная — явка. На графике четыре кривых, потому что ЦИК публикует данные четыре раза — по состоянию на 10 утра, на полдень, на три часа дня и на шесть часов вечера. Естественно, красная кривая, фиксирующая вечерние данные, самая высокая, потому что к этому времени проголосовало больше людей.
Как читать этот график?
Для примера можно взять самую высокую точку красной кривой. Интерпретировать эту точку нужно так: около 252 тысяч голосов (см. вертикаль) отданы на избирательных участках с явкой около 28% (см. горизонталь). Это и есть средняя явка по Москве.
На той же красной кривой возьмем самый правый край — участки с явкой в 100%. И сразу увидим, что на них отдано очень мало голосов — просто потому что таких участков почти не бывает: сложно себе представить много УИКов, на которые вдруг пришли абсолютно все зарегистрированные избиратели.
Что не так с этим графиком?
С этим графиком все так. Голоса правильно распределяются между участками с разной явкой — кривая похожа на колокол. На вершине красной кривой оказывается средняя явка по Москве по данным на шесть часов вечера, и этот показатель совпадает с официальными данными ЦИК. Еще одно свидетельство «нормальности» явки на выборы в Москве — между данными на разные моменты голосования нет непропорциональной разницы, кривые различаются по размеру, но не по форме.
Так, и в чем подвох?
Подвох в том, что если в явке по Москве и Санкт-Петербургу особенных статистических аномалий не наблюдается, в других регионах все иначе. Посмотрите, например, как выглядит похожий график для Кемеровской области.
Посмотрим на вершину красной кривой — получается, в Кемеровской области 120 тысяч голосов было отдано на участках с явкой в 90%. Этот результат сам по себе удивителен — насколько избиратели в Кемеровской области дисциплинированнее москвичей и петербуржцев. Не менее удивительно распределение между участками с разными показателями явки: кривая отличается по форме от московской — она не похожа на аккуратный колокол, а скорее напоминает горные вершины.
И что с того, что кривая не похожа на колокол?
Это странно. Дело в том, что это противоречит математическим законам. Можно посмотреть, как это работает, на примере результатов ЕГЭ. Ученики получают разные оценки — от одного до ста баллов. Распределение результатов экзамена по ученикам подчиняется определенным правилам. Если суммировать всех учеников, получивших одинаковые баллы, и представить эти данные в виде столбиков, самым высоким окажется столбик со средней оценкой. Допустим, больше всего учеников получило за этот экзамен 50 баллов. В этом случае, по правилам статистики, 49 и 51 балл получило чуть меньше учеников. 48 и 52 — еще меньше. И совсем мало школьников, которые получили минимальные и максимальные оценки. Получается, что это столбики постепенно уменьшаются от центрального, образуя все тот же колокол. Если это не так и количество «стобалльников» образует дополнительную вершину на графике, это должно вызвать подозрение. С данными по выборам дела обстоят похожим образом: количество участков должно распределяться равномерно, в форме колокола.
Что означают аномалии с данными явки?
Мы точно не знаем, но, видимо, на волеизъявление людей что-то повлияло. Потому что собранные Сергеем Шпилькиным статистические данные показывают: голосование проходило нестандартно. Что может означать большое количество участков с явкой под 100%? Например, то, что на этих участках кто-то взял неиспользованные бюллетени, заполнил их и опустил в урны — такой вид электоральной махинации называется «вбросом». Таким образом явка сразу выросла до 100%.
Данные по явке иногда могут просто подделать — на бумаге. В этом случае на графиках пики явки приходятся на круглые и полукруглые цифры — 50, 55, 60, 65 процентов и так далее. Людям, которые подделывают показатели явки, проще придумать «красивую» цифру, хотя она и выглядит не очень правдоподобно.
И кому нужны все эти аномалии?
Нынешней партии власти — «Единой России». Во всяком случае, такой вывод можно сделать из анализа, проведенного Сергеем Шпилькиным. Посмотрите на график по явке в Кемеровской области с распределением по голосам, отданным за разные партии. Видно, что самая аномальная кривая — это голоса, отданные за «Единую Россию».
Вот так выглядит «общероссийский» график по явке с распределением голосов за разные партии (справа).
Вот еще один график. Зеленые точки — результат «Единой России» по отдельным участкам. Чем выше явка, тем больше результат у «ЕР». При этом результаты других партий в долевом отношении остаются постоянными, без таких скачков. По расчетам Шпилькина, реальная явка составила около 35% (официально — 47,8%), около 45% поданных за «Единую Россию» голосов были сфальсифицированы.
Допустим, все так и есть. Что теперь будет? Перевыборы?
Нет. Специалисты по статистике далеко не впервые указывают на аномальные данные российских выборов. Но еще ни разу это не приводило к каким-то последствиям, вроде пересмотра результатов выборов. В 2008 году на сайте ЦИК вышла публикация в ответ на статьи о статиcтических «странностях» результатов выборов. Если говорить вкратце, суть сводилась к тому, что на голосование влияет слишком много факторов, в России выборы проходят по неоднородной модели (например, в селе и в городе все по-разному), поэтому нормального распределения ждать не приходится.