?

Log in

No account? Create an account
Фальсификация выборов и теорвер/статистика - Кирилл В
Сентябрь 6, 2016
11:50 am

[Ссылка]

Previous Entry Поделиться Next Entry
Фальсификация выборов и теорвер/статистика
Ну что же, выборы в Думу на носу. В честь этого знаменательного события я решил написать небольшой пост о паре статистических методов, с помощью которых можно выявить являющиеся признаком фальсификации результатов голосования статистические аномалии.



Метод первый. Распределение голосов на избирательных участках.

Взгляните на график внизу, это результаты выборов в Думу в 2011 году. По оси абсцисс отложен результат партии на УИКе. По оси ординат -- кол-во голосов (в миллионах, размер бина 0.5%), от общего числа зарегистрированных избирателей на избирательных участках с такой явкой. Малый график слева-сверху это спектр Фурье.



Во-первых сразу же бросаются в глаза пики на значениях явки 65, 70, 75, 80, 85, 90, 95, 100%. Вероятность случайного возникновения таких регулярных пиков астрономически мала, и при том появление их очень просто объяснить человеческой психологией и стремлением показать "красивые" цифры в отчете. В 2011 под этими пиками находилось около миллиона дополнительных голосов за ЕР, что их итоговый результат меняет не очень сильно (примерно на 1 %). Но зато никаких сомнений в рукотворном происхождении пиков быть не может.

Во-вторых, налицо крайне необычная форма распределения. Помимо основного максимума в районе 55%, распределение имеет «плечо» со стороны больших явок и резкий пик вблизи 100%, причем при высоких явках доли голосов за все кандидатуры, кроме кандидатуры власти, начинают падать, а все потерянные ими голоса вкупе с дополнительными голосами от роста явки отходят к кандидатуре власти. Распределение голосов на честных выборах необязательно должно быть нормальным (например в Англии или Германии на выборах видна четкая корреляция между явкой и результатами разных партий) -- но подобной кластеризации вы там не найдете.

Такой же график для президентских выборов в 2012 году, имеются те же статистические аномалии что и в 2011, пусть и чуть менее ярко выраженные:



Вот более наглядная иллюстрация. По оси абсцисс отложена явка в процентах, а по оси ординат процентная доля избирателей, проголосовавших за выигравшую выборы партию/кандидатуру. Кроме российских выборов в 2011 и 2012 году также приведены результаты выборов в иных странах, в т.ч. и выборы в Уганде на которых партия власти обвинялась в масштабных фальсификациях результатов голосований. Обратите внимание на кластеры участков с высоким процентов явки и высоким же процентом голосов за партию власти (обведены красным):



Причем в самой России в недавнем прошлом гистограмма явки не имела этого ярко выраженного кластера на высоких значениях явки. На графике ниже (источник) показано распределение явки на общероссийских выборах в период с 1995 по 2003 год (не включены национальные республики, с ними уже и тогда были проблемы):



Ну и еще одна визуализация. Совокупное количество голосов за партию власти как процент от явки. Обычно эта кривая выглядит как сигмоида, но в случае с российскими выборами в 2011/2012 и с выборами в Уганде вместо плато на правой части кривой мы имеем весьма высокий прирост.



Больше информации, с конкретными мат. методами которые помогут дать вероятность того или иного распределения голосов:
P. Klimek, Y. Yegorov, R. Hanel, and S. Thurner. Statistical detection of systematic election irregularities (2012).
Kobak D, Shpilkin S, Pshenichnikov MS Statistical anomalies in 2011–2012 Russian elections revealed by 2D correlation analysis (2012)

Метод второй. Анализ последней и первой цифры.

Начнем с анализа последней цифры. Для этого надо взять абсолютную явку и абсолютное количество голосов на всех участках, и записать последную цифру (или последние две цифры, при должном размере участков). Т.е., к примеру, если явка на участке X была 1034 человек -- мы записываем в табличку цифру 4, или цифру 34. Последние цифры явки со всех участков компилируются в один набор данных, и затем мы анализируем их распределение.

В честных выборах распределение этих цифр должно быть более-менее равномерным, ибо последняя цифра абсолютной явки является по сути случайной. Но если результаты "рисуются", то снова проявляется человеческая психология: когда людям надо выдумать некую случайную цифру, они тяготеют к определенным числам (например "красивый" ноль в качестве последней цифры); также не любят повторяющиеся цифры (напр. 22), но в то же время часто выдают последовательные цифры (напр. 12).

В качестве примера, вот анализ выборов в Нигерии по последней цифре явки. Налицо статистическая аномалия, которая может быть объяснена фальсификацией результатов на избирательных участках:



Более подробно тут: Bernd Beber and Alexandra Scacco. What the Numbers Say: A Digit-Based Test for Election Fraud (2012).

Теперь о первой цифре (или первых двух цифрах) абсолютной явки на избирательных участках. Сам метод в принципе очень похож на метод "последней цифры", вот только ожидаемое распределение берется не равномерное, а соответствующее т.н. закону Бедфорда, который описывает вероятность появления определённой первой значащей цифры в распределениях величин, взятых из реальной жизни:



Подробнее тут: Walter R. Mebane. Election Forensics: Vote Counts and Benford’s Law (2006)

Заключение

Оба вышеуказанных метода требуют доступа к данным индивидуальных избирательных участков, так что надеюсь, что в этом году все результаты по УИКам будут также выложены Центризбиркомом РФ в интернет. Скажем, в случае с крымским референдумом в 2014 году в открытый доступ эти данные так и не попали (впрочем там все равно были крайне странные цифры общей явки в Севастополе).

График распределения голосов на этих думских выборах и без меня найдется кому сделать (вангую посты о "пиле Чурова" в топе ЖЖ). А вот анализа первых/последних цифр я в 2011/2012 году не помню, так что буду не прочь буду его в это раз сделать самому и глянуть что там и как. Если результаты будут интересными -- выложу тут.

Ну и необходимый дисклеймер, ибо некоторые, возможно, захотят прикопаться к технической стороне вопроса. Статистические методы никогда не смогут доказать наличие фальсификаций. Они лишь могут отвергнуть нулевую гипотезу (которой в данном случае является тезис "выборы были честными") с некоторым уровнем статистической значимости, и с учетом неких вводных предположений (например центральной предельной теоремы).

Tags: ,

(20 комментариев | Оставить комментарий)

Comments
 
[User Picture]
From:Capt N
Date:Сентябрь 6, 2016 09:29 pm
(Link)
Подозрительная тишина:)
[User Picture]
From:vakhnenko
Date:Сентябрь 6, 2016 10:01 pm
(Link)
Угу. Я всегда в таких случаях размышляю -- то ли я так полно и убедительно раскрыл тему, что и добавить-то нечего, то ли всем решительно пох.

PS Наверное все же второе :)

Edited at 2016-09-06 22:01 (UTC)
[User Picture]
From:psilogic
Date:Сентябрь 7, 2016 12:05 am
(Link)
Полно, убедительно, и всем уже пох, потому, что уже ничего не сделать
[User Picture]
From:vakhnenko
Date:Сентябрь 7, 2016 01:02 am
(Link)
Умгумс. Я только что поговорил с родней из Сыктывкара, народу решительно пох на все это. Причем низкая явка в контексте поста это очень интересно, ибо все статистические аномалии вылезут куда как ощутимей.
From:gukov912
Date:Сентябрь 7, 2016 03:27 am
(Link)
Их никогда и не было.При тайном голосовании, меньшинство по всему миру, захватывают власть. Потом срочно уничтожают бюллетени. В России стать даже кандидатом в депутаты честно невозможно.
[User Picture]
From:burbilog
Date:Сентябрь 7, 2016 06:20 am
(Link)
А при явном голосовании шантажируют голосующих, от чего они вынуждены голосовать за указанных начальством, сказавшим "уволю!".

Тайность голосования есть одна из основ демократии, в принципе.
[User Picture]
From:kernel3
Date:Сентябрь 7, 2016 08:46 pm
(Link)
Реально пох.
На предыдущие выборы ещё (ИМХО) имело смысл идти, но, желательно, наблюдателем; а на эти - нет.
Вот Вале молодец, а я в тот раз поздно сообразил. А потом выяснилось, что на родном участке результаты "выдающиеся" даже по меркам остального района :-/

Edited at 2016-09-07 20:55 (UTC)
[User Picture]
From:vakhnenko
Date:Сентябрь 7, 2016 09:35 pm
(Link)
> потом выяснилось, что на родном участке результаты "выдающиеся" даже по меркам остального района :-/

А что было? Какая явка, какой процент у ЕР?
[User Picture]
From:kernel3
Date:Сентябрь 8, 2016 05:31 pm
(Link)
У педросов 60% с десятыми при количестве проголосовавших ~59% с учётом надомников. Количество проголосовавших в зале кратно 10 :-/

PS вообще, я предыдущую кампанию федерального уровня имел ввиду. Выборы Вовы в 2012-м то бишь. Когда уже после Болотной на том же участке ему 54% насчитали.

Edited at 2016-09-08 17:48 (UTC)
[User Picture]
From:vakhnenko
Date:Сентябрь 8, 2016 06:12 pm
(Link)
Нда, весело. Выборы, выборы (с)
[User Picture]
From:alex_mandel
Date:Сентябрь 8, 2016 03:29 pm
(Link)
Спасибо, весьма информативно и интересно...
[User Picture]
From:vakhnenko
Date:Сентябрь 8, 2016 04:20 pm
(Link)
Пожалуйста!
[User Picture]
From:100_kitaizev
Date:Сентябрь 8, 2016 06:59 pm
(Link)
То что у нас выборы фальсифицируются - давно не новость. Историю про 146% все помнят. Проблема в том, что с этим ни отдельный гражданин, ни группа граждан ничего сделать не могут. Желающих пошуметь успокоят болотными методами. В смысле - арестовать, подержать сутки в автобусах, а потом повесить уголовную статью за попытку переворота тем кто публично выступал. Идеи идеями, а жить хочется дома и целым.

П.С.
Забыл добавить - у нас же вступает в силу "пакет Яровой", по которому и тех кто будет высказывать сомнения в честности и легитимности власти в интернете можно будет также упечь в исправительную колонию по статьям "попытка переворота", "клевета" и даже "терроризм". Учитывая то, что обязывают хранить данные 3 года - любого человека можно будет "закрыть"

Edited at 2016-09-08 19:03 (UTC)
[User Picture]
From:vakhnenko
Date:Сентябрь 8, 2016 07:26 pm
(Link)
> То что у нас выборы фальсифицируются - давно не новость

Оно понятно, но математика:
(1) Дает железобетонные основания утверждать о распространенных фальсификациях. Ибо на все случаи зафиксированные на видеокамеру махинаций на тех или иных УИКах можно просто сказать -- это единичный случай, и вообще всё снято в Катаре. А тут просто мат. анализ официальных данных, ничего более
(2) Дает возможноть прикинуть примерный масштаб фальсификаций, при принятии тех или иных допущений.

> Проблема в том, что с этим ни отдельный гражданин, ни группа граждан ничего сделать не могут

Даже если не могут (а точнее не хотят) -- это не значит, что распространять информацию не надо. Как там у коммунистического классика, "теория становится материальной силой когда она овладевает массами"?

> Забыл добавить - у нас же вступает в силу "пакет Яровой", по которому и тех кто будет высказывать сомнения в честности и легитимности власти в интернете можно будет также упечь в исправительную колонию по статьям "попытка переворота", "клевета" и даже "терроризм".

Будто властям много надо чтобы кого-то упрятать. Взять ту же статью 354.1 -- сказал, например, что СССР начал ВМВ союзником нацистской Германии, и добро пожаловать на нары.

Но опять же -- всех не перевешаете (с)
[User Picture]
From:100_kitaizev
Date:Сентябрь 9, 2016 06:42 am
(Link)
Теории теориями, а тот кто держит в руках три армии в стране - держит всех остальных за яйца. А на легитимные протесты любой власти плевать. Доказательств в мире полно. Распространение информации ничего не даёт кроме наращивания недовольства. Это в конце концов выльется или в типа ленинские-сталинские чистки или в революцию. Ни то, ни другое ни себе, ни своим согражданам не пожелаю. Единственный наименее насильственный метод - это переворот, который невозможен.

> Будто властям много надо чтобы кого-то упрятать

Ну да, "был бы человек, а статья найдётся". А тут даже статью искать не надо. Роботом прошерстил переписку нужного человека по конкретным словам - вот и статей на 10 лет лагерей. И следователям ничего копать не надо. Профит.

> Но опять же -- всех не перевешаете

ну лично мне не хочется оказаться одним из 5 человек которого повесят или застрелят в подвале или одним из оставшихся четырёх, кого сгноят на зоне. Да и кому хочется? самое разумное это голосовать ногами.
[User Picture]
From:syzrzavhoz
Date:Сентябрь 9, 2016 10:16 am
(Link)
Что то смешно. Целая математическая теория, что бы доказать простой факт. Зачем?
[User Picture]
From:peter_hrumov
Date:Сентябрь 20, 2016 07:18 am
(Link)
Факт надо доказывать, в общем-то.
Чем докажете, что вбросы были за ЕР, а не за другую какую-нибудь партию?
[User Picture]
From:syzrzavhoz
Date:Сентябрь 20, 2016 08:48 am
(Link)
Факт надо доказывать, в общем-то.//// Какими то мутными графиками? Тогда первый вопрос - по умолчанию принято, что выборы в Уганде недемократичны, а в Испании демократичны. С чего бы?

Чем докажете, что вбросы были за ЕР, а не за другую какую-нибудь партию?\\\\\ ..... А с чего вы решили, что я считаю, что вбросы были за ЕР?
[User Picture]
From:vakhnenko
Date:Сентябрь 20, 2016 04:55 pm
(Link)
> Какими то мутными графиками?

С чего они мутные? Потому что вам не нравятся? Они какбе просто визуализируют официальную инфу от центризберкома, так что на пятую колонну это не спишешь.

Если вы считаете, что графики неверно оную инфу показывают -- сделайте свои, где все будет как надо.
[User Picture]
From:syzrzavhoz
Date:Сентябрь 26, 2016 09:13 am
(Link)
Потому что вам не нравятся?... С чего вы это решили?
так что на пятую колонну это не спишешь..... А на шестую колонну?
Если вы считаете,... Я просто считаю, что графиками вы ничего никому не докажете. Они вам служат только для укрепления вашей+определенного круга людей веры в нечестности выборов.
Разработано LiveJournal.com